5 research outputs found
gMark: Schema-Driven Generation of Graphs and Queries
Massive graph data sets are pervasive in contemporary application domains.
Hence, graph database systems are becoming increasingly important. In the
experimental study of these systems, it is vital that the research community
has shared solutions for the generation of database instances and query
workloads having predictable and controllable properties. In this paper, we
present the design and engineering principles of gMark, a domain- and query
language-independent graph instance and query workload generator. A core
contribution of gMark is its ability to target and control the diversity of
properties of both the generated instances and the generated workloads coupled
to these instances. Further novelties include support for regular path queries,
a fundamental graph query paradigm, and schema-driven selectivity estimation of
queries, a key feature in controlling workload chokepoints. We illustrate the
flexibility and practical usability of gMark by showcasing the framework's
capabilities in generating high quality graphs and workloads, and its ability
to encode user-defined schemas across a variety of application domains.Comment: Accepted in November 2016. URL:
http://ieeexplore.ieee.org/document/7762945/. in IEEE Transactions on
Knowledge and Data Engineering 201
GĂ©nĂ©ration de RequĂȘtes pour les Bases de DonnĂ©es OrientĂ©es Graphes
National audienceLes outils de gestion de bases de donnĂ©es orientĂ©es graphes sont actuellement en Ă©volution permanente. Dans ce contexte, les outils permettant une gĂ©nĂ©ration de donnĂ©es ainsi que de scĂ©narios de travail sont des Ă©lĂ©ments clĂ©s dans les Ă©tudes empiriques. NĂ©anmoins, les gĂ©nĂ©rateurs actuels de graphe fournissent un support limitĂ©, voire inexistant, dans la gĂ©nĂ©ration de scĂ©narios d'usage, ou s'en tiennent Ă un nombre fixe de cas d'Ă©tudes. Afin de dĂ©passer ces limitations, nous prĂ©sentons gMark, le premier environnement de gĂ©nĂ©ration de graphes synthĂ©tiques et de scĂ©narios d'utilisation indĂ©pendant Ă la fois du domaine et du langage de requĂȘte. Ses principales innovations sont : (i) un contrĂŽle prĂ©cis de l'instance de graphe gĂ©nĂ©rĂ© et des requĂȘtes correspondantes Ă partir de schĂ©mas dĂ©finis par l'utilisateur ; (ii) le support d'un langage de requĂȘte expressif, incluant notamment la rĂ©cursion ; et (iii) une estimation de la sĂ©lectivitĂ© des requĂȘtes gĂ©nĂ©rĂ©es. Durant cette dĂ©monstration, nous illustrerons la capacitĂ© hautement paramĂ©trable des graphes et des requĂȘtes gĂ©nĂ©rĂ©s Ă travers diffĂ©rents schĂ©mas et diffĂ©rentes sĂ©lectivitĂ©s choisies, et la variĂ©tĂ© des langages de requĂȘtes supportĂ©s par le systĂšme. Nous montrerons Ă©galement une comparaison des performances de quatre moteurs de requĂȘtes de l'Ă©tat de l'art, et comment les scĂ©narios gĂ©nĂ©rĂ©s par gMark nous permettent de comprendre leurs forces respectives, et les Ă©volutions que l'on pourrait souhaiter
Generating Flexible Workloads for Graph Databases
International audienceGraph data management tools are nowadays evolving at a great pace. Key drivers of progress in the design and study of data intensive systems are solutions for synthetic generation of data and workloads, for use in empirical studies. Current graph generators, however, provide limited or no support for workload generation or are limited to fixed use-cases. Towards addressing these limitations, we demonstrate gMark, the first domain- and query language-independent framework for synthetic graph and query workload generation. Its novel features are: (i) fine-grained control of graph instance and query workload generation via expressive user-defined schemas; (ii) the support of expressive graph query languages, including recursion among other features; and, (iii) selectivity estimation of the generated queries. During the demonstration, we will showcase the highly tunable generation of graphs and queries through various user-defined schemas and targeted selectivities, and the variety of supported practical graph query languages. We will also show a performance comparison of four state-of-the-art graph database engines, which helps us understand their current strengths and desirable future extensions
gMark : GĂ©nĂ©ration de Graphes et de RequĂȘtes DirigĂ©e par le SchĂ©ma
National audienceLes jeux de donnĂ©es reprĂ©sentĂ©s par des graphes de grande taille sont omniprĂ©sents dans les domaines applicatifs actuels. C'est pourquoi les bases de donnĂ©es orientĂ©es graphes jouent un rĂŽle de plus en plus important. Dans l'Ă©tude de ces systĂšmes, il est vital que la communautĂ© scientifique ait Ă sa disposition des solutions pour gĂ©nĂ©rer des jeux de donnĂ©es de rĂ©fĂ©rence comprenant des instances de base de donnĂ©es et des requĂȘtes ayant des propriĂ©tĂ©s prĂ©visibles et contrĂŽlables. Dans cet article, nous prĂ©sentons les principes Ă la fois thĂ©oriques et d'ingĂ©nierie de gMark, un systĂšme gĂ©nĂ©rique de gĂ©nĂ©ration de graphes et de requĂȘtes basĂ© sur une gestion flexible des schĂ©mas et des requĂȘtes. Une contribution centrale de gMark est sa capacitĂ© Ă viser et Ă contrĂŽler la diversitĂ© des propriĂ©tĂ©s Ă la fois des instances de graphes gĂ©nĂ©rĂ©s et des requĂȘtes correspondantes Ă celles ci. Une autre innovation est la capacitĂ© Ă gĂ©nĂ©rer des requĂȘtes rĂ©cursives basĂ©es sur des expressions rĂ©guliĂšres de chemin, un paradigme important dans les requĂȘtes sur les graphes. Nous illustrons Ă la fois la flexibilitĂ© et l'applicabilitĂ© de gMark en montrant ses capacitĂ©s Ă gĂ©nĂ©rer des graphes et des requĂȘtes de haute qualitĂ©, et sa capacitĂ© Ă exploiter des schĂ©mas dĂ©finis par l'utilisateur dans plusieurs domaines applicatifs diffĂ©rents
GĂ©nĂ©ration de RequĂȘtes pour les Bases de DonnĂ©es OrientĂ©es Graphes
National audienceLes outils de gestion de bases de donnĂ©es orientĂ©es graphes sont actuellement en Ă©volution permanente. Dans ce contexte, les outils permettant une gĂ©nĂ©ration de donnĂ©es ainsi que de scĂ©narios de travail sont des Ă©lĂ©ments clĂ©s dans les Ă©tudes empiriques. NĂ©anmoins, les gĂ©nĂ©rateurs actuels de graphe fournissent un support limitĂ©, voire inexistant, dans la gĂ©nĂ©ration de scĂ©narios d'usage, ou s'en tiennent Ă un nombre fixe de cas d'Ă©tudes. Afin de dĂ©passer ces limitations, nous prĂ©sentons gMark, le premier environnement de gĂ©nĂ©ration de graphes synthĂ©tiques et de scĂ©narios d'utilisation indĂ©pendant Ă la fois du domaine et du langage de requĂȘte. Ses principales innovations sont : (i) un contrĂŽle prĂ©cis de l'instance de graphe gĂ©nĂ©rĂ© et des requĂȘtes correspondantes Ă partir de schĂ©mas dĂ©finis par l'utilisateur ; (ii) le support d'un langage de requĂȘte expressif, incluant notamment la rĂ©cursion ; et (iii) une estimation de la sĂ©lectivitĂ© des requĂȘtes gĂ©nĂ©rĂ©es. Durant cette dĂ©monstration, nous illustrerons la capacitĂ© hautement paramĂ©trable des graphes et des requĂȘtes gĂ©nĂ©rĂ©s Ă travers diffĂ©rents schĂ©mas et diffĂ©rentes sĂ©lectivitĂ©s choisies, et la variĂ©tĂ© des langages de requĂȘtes supportĂ©s par le systĂšme. Nous montrerons Ă©galement une comparaison des performances de quatre moteurs de requĂȘtes de l'Ă©tat de l'art, et comment les scĂ©narios gĂ©nĂ©rĂ©s par gMark nous permettent de comprendre leurs forces respectives, et les Ă©volutions que l'on pourrait souhaiter